Centre de Données astronomiques de Strasbourg
Avril 2024
Votre centre de référence
Le CDS développe et propose des services autour des données de recherche en astronomie et astrophysique. Les services du CDS sont largement utilisés par la communauté astronomique internationale :
- SIMBAD, la base de données de référence pour la nomenclature et la bibliographie des objets astronomiques (en dehors du système solaire),
- VizieR, le service de référence pour les catalogues astronomiques et les tables publiées dans des journaux de la discipline,
- Aladin, l’atlas interactif du ciel et portail de l’Observatoire Virtuel (VO),
- CDS X-match, le service de corrélation croisée des grands catalogues astronomiques.
Le CDS accompagne les auteurs dans le partage des données liées aux publications. En identifiant et en homogénéisant les données au sein de ses services, ainsi qu’en participant aux actions de standardisation de la discipline, le CDS valorise les données de la recherche en y apportant de la valeur ajoutée et en facilitant leur réutilisation.
D’où vient le besoin de créer une infrastructure spécialisée sur les données de la recherche ?
Le CDS a été créé en 1972 pour les besoins des données stellaires, en particulier autour des études de la structure de notre galaxie. Par la suite, cette nécessité de faire le lien entre les différents identificateurs pour un même objet s’est avérée utile pour l’ensemble des objets de l’astronomie (au-delà du système solaire). Les services se sont étendus aux tables et catalogues des publications, aux images permettant de voir les objets dans leur contexte, et aux outils permettant aux chercheurs d’associer et de comparer ces différentes informations aux autres bases de données de la discipline. Le rôle international était présent dès l’origine. De même, les missions du CDS définies dès le départ restent encore valables aujourd’hui : collecter l’information utile sur les objets astronomiques, les valoriser, les homogénéiser, les redistribuer à la communauté afin de les réutiliser pour la recherche scientifique. Depuis toujours, l’évolution des services du CDS est guidée par la science autour des données pour la communauté astronomie et astrophysique au sens large, ainsi que par les développements numériques existants. Du fait de l’importance de l’utilisation de ses services et du rôle que le CDS joue dans la communauté, c’est aujourd’hui l’une des infrastructures de recherche de la discipline.
Depuis quand votre centre accompagne la gestion des données ? Comment s’est constitué ce service ?
Il y a toujours eu un accompagnement des chercheurs autour de l’utilisation des services et des standards de la discipline. En arrivant au moment de la publication et en aval de celle-ci, le CDS accompagne la préservation et la mise en avant des données pour que celles-ci puissent être facilement échangeables et inter-comparées. Les données du CDS sont FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) par nature. La description des données et leur homogénéisation apportent une valeur ajoutée qui continue de construire de la connaissance et favorise la réutilisation des données. L’inter-comparaison des données et leur réutilisation de manière différente participent aussi à la construction de la confiance dans la qualité des travaux et apporte un impact plus grand aux travaux publiés. Le soutien et l’accompagnement des chercheurs sur tous ces aspects se font lors de différents évènements (écoles sur l’utilisation des outils et services, conférences, actions spécifiques, stands, responsabilités de groupes de travail, …). Le CDS joue ainsi son rôle dans la communauté pour la définition et l’implémentation des bonnes pratiques autour de la publication des données.
Comment accompagnez-vous les chercheurs ?
Nous accompagnons les chercheurs dans leur utilisation des services du CDS, à la fois sur l’ingestion des données des auteurs au moment de leur publication et sur l’utilisation scientifique ou technique des services du CDS. Nous travaillons en coopération avec les principaux journaux d’astronomie, en particulier sur les instructions données aux auteurs pour la préparation des données qui iront au CDS dans l’un des services, ainsi que sur les bonnes pratiques sur la description et le partage des données dans les publications. Au cœur du CDS il y a une équipe intégrée avec trois corps de métiers complémentaires qui se complètent pour fournir un service de qualité :
- les documentalistes chargés du traitement de données scientifiques s’occupent de la curation des données qui seront ingérées dans les différents services du CDS et interagissent avec les auteurs si nécessaire,
- les ingénieurs en informatique s’occupent du développement des outils et des services et répondent aux questions des utilisateurs quant à leur utilisation et leurs fonctionnalités,
- les chercheurs apportent l’expertise scientifique autour des développements des services et de la curation des données. Ils font le lien avec leurs pairs au sein de la discipline, en particulier autour des besoins disciplinaires émergents ou pour promouvoir l’utilisation des services et des bonnes pratiques d’ouverture des données de la recherche.
Quel lien avec les services support en local ?
Le CDS est hébergé par l’Observatoire Astronomique de Strasbourg. C’est un Service National d’Observation de l’Institut National des Sciences de l’Univers (INSU) et une plateforme de l’Université de Strasbourg. Le CDS reçoit le soutien de nos tutelles, l’université de Strasbourg et le CNRS et fonctionne en partenariat avec des acteurs majeurs de la discipline (comme l’ESO, l’ESA, NASA/ADS, …).
Les serveurs du CDS sont hébergés physiquement au Centre de Données de l’université de Strasbourg et sur un site partenaire du CNRS à Cronenbourg.
Le CDS participe au comité de pilotage d’ADELE (Atelier DonnéE aLsacE) Helpdesk, l’atelier de la donnée pour la région Alsace dont l’université de Strasbourg est l’une des tutelles, et participe aux groupes de travail de Recherche Data Gouv faisant le lien entre les centres de référence thématiques et l’ensemble des ateliers de la donnée en France.
Que représente le label “centre de référence thématique” de Recherche Data Gouv pour vous ?
Les centres de référence thématiques de Recherche Data Gouv sont des infrastructures de recherche représentant l’expertise thématique de certaines disciplines ayant une bonne expérience du partage des données, de la contribution à la standardisation de la description des données et une connaissance de la structuration du paysage des données au niveau disciplinaire. Le CDS n’est pas la seule entité de la recherche en astronomie et en astrophysique à s’occuper du partage des données, mais elle démontre par ce label “centre de référence thématique” une bonne connaissance des pratiques d’ouverture, de partage et de valorisation des données en astronomie et astrophysique, ainsi que son rôle dans notre communauté.
Le label “centre de référence thématique” est une opportunité pour le CDS de partager avec l’ensemble des disciplines notre culture disciplinaire d’ouverture des données et de leur réutilisation telle qu’elle s’est faite en astronomie et astrophysique au niveau international depuis plus de 50 ans. C’est aussi une façon d’inscrire la communauté astronomie et astrophysique dans le paysage national des données ouvertes.
Présentez une action particulièrement importante du centre en matière d’accompagnement à la gestion des données.
Le CDS joue un rôle majeur en astronomie et astrophysique avec des services de données de référence. Le CDS traite ~15 000 articles et ~1500 jeux de données par an. Les services sont largement utilisés dans la communauté de recherche en astronomie et astrophysique, ce qui peut se mesurer à l’aide du très grand nombre de requêtes qui avoisinait les 3 millions de requêtes par jour en 2023.
En documentant et en combinant les données qui sont conservées au CDS, nos services exposent les données tout en produisant de la valeur ajoutée (cross-identification d’objets, méta-catalogues, relevés hiérarchiques d’images), ce qui facilite la réutilisation des données et les valorise, créant un cycle vertueux des données ouvertes en astronomie et astrophysique.
Ces dernières années, nous avons lancé une campagne “make your data visible” qui vise à favoriser les bonnes pratiques de publication des données tabulaires auprès des auteurs de publications scientifiques. Cette campagne se complète d’actions de communication autour des bonnes pratiques dans différentes conférences internationales renommées de la discipline. Ces actions et celles de nos partenaires sont regroupées dans un article de référence: Best Practices for Data Publication in the Astronomical Literature. L’ensemble de ces messages encourage les auteurs à adopter de nouvelles pratiques autour du partage de données et en particulier de leur description, et favorise ainsi la réutilisation et la visibilité des données de la recherche en astronomie et astrophysique.